查看原文
其他

MIT科技评论:生成式人工智能如何重塑游戏的意义

Niall Firth 科睿研究院
2024-08-30


本文原文标题为How generative AI could reinvent what it means to play,原文来自MIT科技评论;


作者Niall Firth,现居伦敦。《新闻编辑室》执行编辑,负责监督MIT在线新闻,管理报道团队。此前,他曾担任《新科学家》杂志的首席新闻编辑,还曾担任技术编辑。




首先,我要坦白:我刚开始玩电子游戏才一年多一点。一份“给孩子们”的圣诞礼物 Xbox Series S 把我带进了深夜游戏的世界——结果发现,这很容易就让我进入了深夜游戏的世界。我立刻被开放世界游戏所吸引,在游戏中,你可以自由探索广阔的模拟世界并选择接受什么挑战。


《荒野大镖客 2》(RDR2)是一款以狂野西部为背景的开放世界游戏,它让我大开眼界。我骑着马穿过沉睡的小镇,在酒吧喝酒,参观杂耍剧院,击退赏金猎人。有一天,我只是在一个偏僻的山顶上扎营,煮咖啡,凝视着下面雾气弥漫的山谷。


为了让游戏更加生动,开放世界游戏中充斥着大量由计算机控制的角色。这些动画人物(称为 NPC,即“非玩家角色”)居住在游戏中的酒吧、城市街道或太空港中。他们让这些虚拟世界更加生动、充实。通常(但并非总是如此)你可以与他们交谈。


在《荒野大镖客 2》等开放世界游戏中,玩家可以在相同的模拟体验中选择不同的互动。


然而过了一会儿,路过的陌生人不断的闲聊(或威胁)迫使你面对现实:这只是一场游戏。它仍然很有趣——老实说,我玩得很开心,抢劫驿马车、在酒吧斗殴中打架、在雨天的树林里跟踪鹿——但当你戳它时,这种幻觉就开始减弱了。这是很自然的。电子游戏是精心制作的物品,是价值数十亿美元的产业的一部分,旨在被消费。你玩它们,抢劫几辆驿马车,你通关,然后继续前进。 


但情况可能并非总是如此。正如它正在颠覆其他行业一样,生成式人工智能正在为全新的游戏内互动打开大门,这些互动是开放的、有创意的、出乎意料的。游戏可能并不总是要结束的。


ChatGPT 等初创公司正在使用生成式人工智能模型来创建不依赖脚本的角色,而是自由地与您交谈。其他人正在尝试使用 NPC,这些 NPC 似乎拥有完整的内部世界,即使玩家不在场,他们也可以继续玩游戏。最终,生成式人工智能可以创造出无限细致的游戏体验,每次体验时都会发生扭曲和变化。 


这个领域还很新,但非常热门。2022 年,风险投资公司 Andreessen Horowitz 推出了 Games Fund,这是一支 6 亿美元的基金,专门用于游戏初创公司。其中很多公司计划在游戏中使用人工智能。该公司(也称为 A16Z)现已投资两家工作室,旨在创建自己的 AI NPC 版本。第二轮 6 亿美元融资于 2024 年 4 月宣布。


这些体验的早期实验演示已经出现,可能不久就会出现在像 RDR2 这样的完整游戏中。但业内一些人认为,这一发展不仅会让未来的开放世界游戏变得极具沉浸感;它可能会改变游戏世界或体验的可能类型。最终,它可能会改变游戏的意义。


“视频游戏之后会是什么?你懂我的意思吗?”游戏设计师兼纽约大学游戏中心总监弗兰克·兰茨说道。“也许我们正处在一种新型游戏的门槛上。”



01

这些家伙就是不肯闭嘴


多年来,电子游戏的制作方式并没有太大变化。图像非常逼真。游戏规模更大。但与角色以及游戏世界互动的方式仍沿用了数十年的传统。


“在主流游戏中,我们仍在研究自 20 世纪 80 年代以来的公式的变体,”纽约大学计算机科学教授朱利安·托格利厄斯 (Julian Togelius) 说道,他创办了一家名为 Modl.ai 的初创公司,负责进行游戏内测试。这个久经考验的公式的一部分是一种称为对话树的技术,其中列出了 NPC 的所有可能反应。您得到哪种反应取决于您选择的对话树的哪个分支。例如,在 RDR2 中对路过的 NPC 说一些粗鲁的话,角色可能会发怒——您必须迅速道歉以避免枪战(除非这是您想要的)。


在最昂贵、最受关注的游戏,即所谓的 AAA 游戏(如 Elden Ring 或 Starfield)中,更深层的沉浸感是通过使用蛮力来构建深厚而庞大的对话树来创造的。最大的工作室雇佣了数百名游戏开发人员组成的团队,他们多年来一直在为一款游戏工作,游戏中的每一句对话都经过策划和规划,软件也经过编写,以便游戏引擎知道何时部署特定的台词。据报道,RDR2包含约 500,000 句对话,由大约 700 名演员配音。 


托格利斯说:“你要意识到,世界上你能做的事情有限,只有通过大量的写作和设计才能实现。” 


生成式人工智能已经帮助减轻了新游戏制作过程中的一些繁琐工作。A16Z 的普通合伙人兼 Games Fund 的经理之一 Jonathan Lai 表示,大多数工作室都在使用 Midjourney 等图像生成工具来增强或简化他们的工作。


在 A16Z 于 2023 年进行的一项调查中,87% 的游戏工作室表示他们已经以某种方式在工作流程中使用了人工智能,99% 的游戏工作室计划在未来这样做。许多游戏工作室使用人工智能代理来取代寻找漏洞(例如游戏可能崩溃的地方)的人类测试人员。最近几个月,游戏巨头 EA 的首席执行官表示,生成式人工智能可用于其 50% 以上的游戏开发流程。


育碧是最大的游戏开发商之一,以《刺客信条》等 AAA 级开放世界游戏而闻名,该公司一直在使用一款名为 Ghostwriter 的基于大型语言模型的 AI 工具,帮助开发人员完成一些繁重的工作,为 NPC 编写基本对话。Ghostwriter 为背景人群聊天生成了大量选项,人类作家可以从中挑选或调整。这样做的目的是解放人类,让他们有更多时间专注于情节的写作。



但归根结底,一切都是剧本。一旦你在一款游戏上花了一定时间,你就会看遍所有可看内容,完成所有互动。是时候买一款新游戏了。


但对于像 Inworld AI 这样的初创公司来说,这种情况是一个机会。总部位于加利福尼亚州的 Inworld 正在开发工具,让游戏中的 NPC 能够以动态、非脚本化的对话和动作来响应玩家,这样他们就不会重复自己。该公司目前估值 5 亿美元,是资金最充足的 AI 游戏初创公司,这要归功于前谷歌首席执行官埃里克·施密特和其他知名投资者的支持。 


Inworld 首席执行官兼创始人 Kylan Gibbs 解释说,角色扮演游戏为我们提供了一种体验不同现实的独特方式。但总有一些东西缺失了。“基本上,里面的角色都死了,”他说。 


“当你考虑整个媒体,无论是电影、电视还是书籍,角色才是我们与世界产生共鸣的真正驱动力,”吉布斯说。“因此,游戏,可以说是我们拥有的最先进的叙事方式,却缺少这些活生生的角色——这对我们来说是一个相当大的问题。”


游戏玩家们很快就意识到 LLM 可以帮助填补这一空白。去年,一些人为热门角色扮演游戏《天际》制作了 ChatGPT 模组(一种改变现有游戏的方法)。


这些模组让玩家可以使用 LLM 支持的免费聊天功能与游戏中的众多角色进行互动。其中一个模组甚至包括 OpenAI 的语音识别软件 Whisper AI,这样玩家就可以用自己的声音与玩家交谈,说出他们想说的任何话,并进行不再受对话树限制的完整对话。 


结果让玩家们看到了可能实现的效果,但最终还是有点令人失望。虽然对话是开放式的,但角色互动却很生硬,ChatGPT 处理每个请求时都会出现延迟。 


Inworld 希望让这种互动更加精致。它为 AAA 游戏工作室提供了一种产品,开发人员可以在其中创建 AI NPC 的大脑,然后将其导入到他们的游戏中。开发人员使用该公司的“Inworld Studio”来生成他们的 NPC。


例如,他们可以填写一个核心描述,勾勒出角色的个性,包括好恶、动机或有用的背景故事。滑块可以让你设置性格的级别,例如内向或外向、不安全感或自信。你还可以使用自由文本让角色喝醉、好斗、容易夸张——几乎任何东西。


开发人员还可以添加角色说话方式的描述,包括常用短语的示例,Inworld 的各种 AI 模型(包括 LLM)随后将这些短语转换为与角色相符的对话。


由于依赖大量劳动密集型的脚本,因此很难让角色处理场景中可能出现的各种情况,尤其是当游戏变得越来越开放时。

——Bitpart 创始人 Jeff Orkin


游戏设计师还可以将其他信息插入到系统中:角色对这个世界了解什么和不了解什么(中世纪战斗游戏中最好不要引用泰勒·斯威夫特的话)以及任何相关的安全防护措施(你的角色会骂人吗?)。


叙事控制将让开发人员确保 NPC 坚持故事情节,不会在对话中偏离主题。这个想法是,角色可以导入 Unity 或 Unreal Engine 等视频游戏图形引擎,以添加身体和特征。Inworld 正在与文本转语音初创公司 ElevenLabs 合作,添加听起来自然的声音。


Inworld 的技术尚未出现在任何 AAA 游戏中,但在 2024 年 3 月于旧金山举行的游戏开发者大会 (GDC) 上,该公司与 Nvidia 合作发布了一款早期演示,展示了一些可能实现的功能。在 Covert Protocol 中,每个玩家都扮演私家侦探,必须使用来自游戏中各个 NPC 的输入来破案。同样在 GDC 上,Inworld发布了一款名为 NEO NPC 的演示,该演示由其与 Ubisoft 合作开发。在 NEO NPC 中,玩家可以使用语音转文本软件自由地与 NPC 互动,并通过对话与他们建立更深层次的关系。


Bitpart AI 是一家新创业公司,其目标也是创建由AI驱动的整套 NPC,并将它们导入到游戏中。“由于依赖大量劳动密集型脚本,因此很难让角色处理各种场景,尤其是当游戏变得越来越开放时,”他说道。


Bitpart 的方法在一定程度上受到了 Orkin 在麻省理工学院媒体实验室的博士研究的启发。在那里,他利用多人游戏中人类彼此做同样事情的游戏日志来训练 AI 进行社交场景角色扮演。


Bitpart 的角色阵容使用大型语言模型进行训练,然后进行微调,这意味着游戏中的互动并非完全开放和无限。相反,该公司使用 LLM 和其他工具来生成涵盖一系列可能互动的脚本,然后由人类游戏设计师选择一些。Orkin 将这个过程描述为创作互动的乐高积木。游戏中的算法会搜索出特定的积木,并在适当的时间将它们串在一起。


Bitpart 的方法可以创造一些令人愉快的游戏时刻。例如,在餐厅里,你可能会向服务员要东西,但酒保可能会无意中听到并加入进来。Bitpart 的人工智能目前与 Roblox 合作。Orkin 表示,该公司目前正在与 AAA 游戏工作室进行试验,尽管他尚未透露是哪些工作室。


但生成式人工智能的作用可能不只是增强现有游戏的沉浸感,它还可能催生全新的游戏方式。



02

让不可能成为可能


当我问 Frank Lantz 人工智能如何改变游戏时,他连续说了 26 分钟。他对生成式人工智能的最初反应是发自内心的:“我当时想,天哪,这是我的命运,也是我来到这个世界上的原因。” 


几十年来,兰兹一直处于游戏行业和人工智能的前沿,但几年前,当他创建了 Universal Paperclips 游戏时,他获得了狂热的赞誉。这款简单的浏览器内游戏要求玩家制作尽可能多的回形针。它改编自哲学家尼克·博斯特罗姆的著名思想实验,该实验设想一个人工智能被赋予同样的任务,并通过将已知宇宙中的所有物质变成回形针来优化人类的利益。


Lantz 有很多使用生成式 AI 的方法。其中一种是体验正在创作的新艺术作品,让玩家参与其中。“你置身于正在创作的《指环王》之类的作品之中。你置身于文学作品之中,它正在你身边实时展开,”他说。他还设想了策略游戏,玩家和 AI 共同合作,重新定义游戏类型和规则,让游戏永远不会重复。


对于 Orkin 来说,LLM 驱动的 NPC 可以让游戏变得不可预测——这很令人兴奋。“它引入了很多开放性问题,比如当角色回答你时你会做什么,但这会让故事朝着没有人计划的方向发展,”他说。 


生成式人工智能可能不仅仅能增强现有游戏的沉浸感,它还能催生全新的游戏方式。


这可能意味着游戏与我们迄今为止见过的任何游戏都不一样。随着角色关系的转变和变化,随着友谊的开始和结束,游戏体验可能会开启全新的叙事体验,这种体验更多地关注对话和个性,而不是动作。 


Togelius 设想了一个新世界,这个世界会根据玩家自己的需求和愿望而构建,其中充满了 NPC,玩家必须在游戏过程中教导或影响他们。想象一下与角色互动,他们的观点可以改变,你可以说服或激励他们以某种方式行事——比如,与你并肩作战。“一款完全生成的游戏可能非常非常好,”他说。“但你真的必须改变你对游戏的整个期望。”


Lantz 目前正在开发一款游戏原型,游戏前提是你——玩家——醒来后发现自己已经死亡,而你身处的来世是一个廉价的合成世界。这款游戏就像一部黑色电影,你必须探索一座由 ChatGPT 版本驱动的、充满数千名 NPC 的城市,你必须与他们互动,才能弄清楚你是如何来到这里的。 



早期的实验给他带来了一些怪异的感觉,他觉得这些角色似乎知道的东西比他们应该知道的多,这种感觉对以前玩过 LLM 的人来说很熟悉。即使你知道他们不是活的,他们仍然会让你有点害怕。

“如果你用电流通过青蛙的尸体,青蛙就会动起来,”他说,“如果你通过互联网进行价值 1000 万美元的计算……它就会像青蛙一样移动,你知道吗。” 

但这些早期对生成式人工智能游戏的尝试让他对接下来的事情真正感到兴奋:“我觉得,好吧,这是一个线索。这里确实有一种新的艺术形式。”


03

如果 AI NPC 说话但周围没有人听,

会有声音吗?


AI NPC 不仅会增强玩家互动,他们还可能以奇怪的方式相互互动。《荒野大镖客 2》的每个 NPC 都有详细的长篇脚本,详细说明他们应该去哪里、必须完成哪些工作以及如果发生任何意外情况他们会如何反应。如果你愿意,你可以跟随 NPC 并观察它的日常生活。这很有趣,但最终它是硬编码的。


使用生成式 AI 构建的 NPC 可以拥有更多的自由度——甚至在玩家不在场时也可以相互交互。就像人们被愚弄认为 LLM 具有感知能力一样,观察一座由生成的 NPC 组成的城市可能会感觉像是透过一个不知何故神奇地活过来的玩具盒的顶部窥视一样。


我们已经对这种现象有了些许了解。在斯坦福大学,Joon Sung Park 一直在试验人工智能生成的角色,观察它们在相遇时的行为如何变化并变得更加复杂。 


他说,由于大型语言模型吸收了互联网和社交媒体的数据,它们实际上包含了大量有关我们的行为和互动方式的细节。


在 Park 最近的研究中,他和同事们设计了一款类似《模拟人生》的游戏,名为《超人前传》,其中有 25 个模拟角色,这些角色都经过了生成式人工智能的训练。每个角色在开始行动之前都被赋予了一个名字和一段简单的传记。经过两天的互动后,这些角色开始表现出类似人类的对话和行为,包括互相记住对方并能够谈论他们过去的互动。 


例如,研究人员让一个角色组织一个情人节派对,然后让模拟运行。该角色向镇上的人发出邀请,而社区的其他成员则互相约好去参加派对,所有人都在正确的时间出现在会场。所有这些都是通过对话进行的,角色之间过去的互动以自然语言的形式存储在他们的“记忆”中。


对于 Park 来说,这对游戏的影响是巨大的。“这正是游戏社区一直在等待的 NPC 技术,”他说。 


他的研究启发了 AI Town 等游戏的诞生。AI Town 是 GitHub 上的一款开源互动体验游戏,允许人类玩家在一款简单的自上而下游戏中与 AI NPC 互动。你可以让 NPC 们相处几天,然后查看他们的情况,阅读你不在时他们的互动记录。任何人都可以自由地使用 AI Town 的代码,通过 AI 构建新的 NPC 体验。 


对于初创公司 Character AI 的联合创始人丹尼尔·德弗雷塔斯来说,生成式人工智能革命将允许新类型的游戏出现,这些游戏中的 NPC 甚至不需要人类玩家。该公司允许用户生成自己的基于 LLM 学位的角色并与之互动。 


他想象着玩家“正在参与一场由人工智能扮演的、一直在发生的冒险。这相当于加入一个充满演员的主题公园,但与演员不同的是,他们真正‘相信’自己扮演的是这些角色。”


如果你现在有《西部世界》的感觉,那你并不孤单。有很多关于人们在游戏中折磨或杀死他们简单的模拟人物以取乐的故事。虐待被当作真人的 NPC 会不会跨越某种新的道德界限?兰兹问道,如果一个看似有意识的人工智能 NPC 在你模拟折磨它时乞求饶命,会怎么样?


他补充说,这引发了一些复杂的问题。“一个问题是:假装暴力的道德层面是什么?另一个问题是:人工智能在什么时候会成为可以造成伤害的道德主体?”


还有其他潜在问题。沉浸式的世界让人感觉真实,永无止境,可能会让人上瘾。一些人工智能聊天机器人的用户已经报告说,他们在与机器人的对话中浪费了数小时甚至数天的时间。人工智能 NPC 之间是否会出现同样的准社会关系? 


“我们可能需要担心人们在某个时候会与游戏角色形成不健康的关系,”托格利斯说。到目前为止,玩家能够很容易地区分游戏和现实生活。但人工智能 NPC 可能会改变这一点,他说:“如果在某个时候我们现在所说的‘视频游戏’变成了某种包罗万象的虚拟现实,从某种意义上说,我们可能需要担心 NPC 太好的影响。”


04

艺术家年轻时的机器人肖像


并不是所有人都相信,玩家和 NPC 之间永无止境的开放式对话才是我们真正希望的游戏未来。 


“我认为我们必须谨慎地将我们的想象与现实联系起来,”人工智能研究员兼游戏设计师迈克·库克 (Mike Cook) 表示。“在游戏中,你可以去任何地方、与任何人交谈、做任何事情,这一直是某些玩家的梦想。但在实践中,这种自由往往与我们想要的故事内容相矛盾。”


换句话说,自己创作大量对话实际上可能会有点……无聊。“如果你想不出有趣或戏剧性的内容,或者只是太累或无聊而不想这样做,那么你基本上就是在读你自己创作的非常糟糕的虚构作品,”库克说。 


Orkin 也同样认为,大多数玩家实际上并不想进行无休止的对话。“我想玩一款由一群才华横溢、富有创造力的人精心设计并创造出引人入胜的故事和世界的游戏,”他说。


Togelius 也认为作者身份是游戏玩法的重要组成部分。“你可以随心所欲地创作内容,”他说。“但这并不能保证所有内容都是有趣的、值得保留的。事实上,你创作的内容越多,可能就越无聊。”



有时,万事皆有可能,让人难以应对。《无人深空》是一款备受关注的太空游戏,于 2016 年推出,使用算法生成了无数可供探索的星球,但当它终于问世时,许多玩家都感到有些失望。玩家很快发现,能够探索一个永无止境的宇宙,拥有无穷无尽的不同世界,这实际上有点平淡无奇。(随后几年的一系列更新使《无人深空》更加结构化,现在普遍受到好评。)


一种方法可能是保持 AI 游戏体验紧密且专注。


游戏初创公司 Hidden Door 的首席执行官希拉里·梅森 (Hilary Mason) 喜欢开玩笑说,她的工作是“手工 AI”。她的同事、该公司的游戏总监克里斯·福斯特 (Chris Foster) 笑着说,毕竟她来自布鲁克林。


Hidden Door 尚未发布任何产品,它正在制作基于经典故事的角色扮演文本冒险游戏,用户可以操纵这些游戏。它就像是生成式人工智能时代的《龙与地下城》。它将某些冒险世界的经典比喻和包含数千个单词和短语的注释数据库拼凑在一起,然后使用包括 LLM 在内的各种机器学习工具,使每个故事都独一无二。玩家经历一种半非结构化的叙事体验,自由地在文本框中输入内容来控制他们的角色。 


结果感觉有点像用便利贴手工注释人工智能生成的小说。


在 Mason 的演示中,我看到她扮演的角色潜入医院并试图入侵服务器。每条建议都会促使系统启动故事的下一部分,大型语言模型会即时创建新的描述和游戏内对象。


每次体验持续 20 到 40 分钟,对于福斯特来说,它创造了一个可供人们玩耍的“富有表现力的画布”。固定长度和添加的人性化元素——梅森的手工方法——为玩家带来了“真正新颖和神奇的东西”,他说。



05

生活不仅仅只有游戏


帕克认为,让游戏中的 NPC 感觉栩栩如生的生成式人工智能在未来还会产生其他更为根本的影响。

“我认为,这也能改变游戏的意义,”他说。 


例如,他对使用生成式人工智能代理来模拟真实人类的行为感到兴奋。他认为人工智能代理有朝一日可以作为真实人类的代理,例如,测试对新经济政策的可能反应。可以插入反事实场景,让政策制定者倒推时间,试图看看如果采取不同的路径会发生什么。 


“你要知道,如果你实施这项社会政策或经济政策,它将对目标人群产生什么影响?”他建议道。“会不会有我们第一天无法预见的意外副作用?”



Inworld 专注于为电子游戏增添沉浸感,同时还与韩国 LG 公司合作,制作了可供儿童聊天的角色,以提高他们的英语水平。其他公司则利用 Inworld 的技术创造互动体验。其中一款名为《曼扎纳尔时刻》的游戏旨在帮助玩家对二战期间被美国政府关押在拘留营中的日裔美国人产生共鸣。它允许用户与一个名叫 Ichiro 的虚构人物交谈,后者讲述了被关押在加州曼扎纳尔集中营的感受。 


Inworld 的 NPC 野心可能会让游戏玩家感到兴奋(我未来扮演牛仔的经历可能会更加身临其境!),但有些人认为使用人工智能来增强现有游戏的想法太小了。相反,我们应该利用 LLM 的奇特之处来创造以前不可能实现的全新体验,Togelius 说。他说,LLM 的缺点“不是缺陷,而是功能”。 


Lantz 对此表示同意。“你必须首先了解这些东西是什么以及它们的作用——这种你正在探索的潜在可能性空间,”他说。“这些引擎本身就具有那种迷幻的特质。它们有一种迷幻的感觉。我感兴趣的是解开这种迷幻的特质。”


兰兹想,无论接下来会发生什么,我们可能都还没有想象过。 


“也许这根本就不是一个有假角色的模拟世界,”他说。“也许这是完全不同的东西。我不知道。但我很想找到答案。”



科睿研究院最早成立于中国香港特别行政区,是国际科学与人文科学院(International Core Academy of Sciences and Humanities)建设的综合性研究机构,致力于搭建学术界与社会间高效沟通的桥梁,将前沿的学术研究成果赋能至新时代社会发展。


作为科睿研究院主办的官方号,我们致力于打造高质量知识交流平台:持续推出与当代社会相关的洞察分析与时事评论,定期发布高质量专栏文章与交流活动,并推送有价值的学术资源和最新资讯。同时,学院积极欢迎读者们的踊跃来稿,参与我们的知识传递之旅中!


往期推荐

1

匈牙利:中国成最大海外投资来源国,它会是中国汽车赶赴欧盟市场的桥头堡吗?

2

纳米材料领域的科研先驱:瓦里耶夫教授

3

英国巨变:工党上台,对中国影响几何?

4

特朗普和拜登都说自己赢了,最后输的还能是谁?



素材来源官方媒体/网络新闻
继续滑动看下一个
科睿研究院
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存